Spark Streaming實時計算框架介紹 隨着大數據的發展,人們對大數據的處理要求也越來越高,原有的批處理框架MapReduce適合離線計算,卻無法滿足實時性要求較高的業務,如實 ...
Spark Streaming實時計算框架介紹 隨着大數據的發展,人們對大數據的處理要求也越來越高,原有的批處理框架MapReduce適合離線計算,卻無法滿足實時性要求較高的業務,如實 ...
Kafka與Logstash的數據采集 基於Logstash跑通Kafka還是需要注意很多東西,最重要的就是理解Kafka的原理。 Logstash工作原理 由於Kafk ...
Elasticsearch索引mapping的寫入、查看與修改 https://blog.csdn.net/napoay/article/details/52012249 首先創建一個索引: c ...
大數據平台的數據采集 數據采集的設計,幾乎完全取決於數據源的特性,畢竟數據源是整個大數據平台蓄水的上游,數據采集不過是獲取水源的管道罷了。 在數據倉庫的語境下,ETL基本上就是數據采集的代 ...
日志收集之kafka http://www.jianshu.com/p/f78b773ddde5 一、介紹 Kafka是一種分布式的,基於發布/訂閱的消息系統。主要設計目標如下: 以 ...
Elasticsearch 的坑爹事——記錄一次mapping field修改過程 http://www.cnblogs.com/Creator/p/3722408.html Elasticsea ...
windows 64 curl 命令的使用 https://blog.csdn.net/qq_27093465/article/details/53545693 curl命令可以通過命令行的方式, ...
Kafka是分布式發布-訂閱消息系統 https://www.biaodianfu.com/kafka.html Kafka是分布式發布-訂閱消息系統。它最初由LinkedIn公司開發,之后成為A ...
隱馬爾可夫模型(HMM) 原文地址:http://www.cnblogs.com/jacklu/p/7753471.html 本文結合了王曉剛老師的ENGG 5202 Patte ...
SPARK如何使用AKKA實現進程、節點通信 《深入理解Spark:核心思想與源碼分析》一書前言的內容請看鏈接《深入理解SPARK:核心思想與源碼分析》一書正式出版上市 《深入理解Spar ...